Google's Project Astra, Veo en Gemini Upgrades Strijd AI Vooruitgang
Dit is Google's reactie op OpenAI.
Een algemene AI, een AI die dagelijks echt gebruikt kan worden, het zou gênant zijn om een persconferentie te houden als het nu niet zo is.
In de vroege ochtend van 15 mei begon de jaarlijkse "Lente Festival Gala van de Technologie Wereld" Google I/O Developers Conference officieel. Hoe vaak werd kunstmatige intelligentie genoemd in de 110 minuten durende hoofdtoespraak? Google heeft het geteld:
Ja, AI wordt elke minuut besproken.
De concurrentie van generatieve AI heeft onlangs een nieuw hoogtepunt bereikt, en de inhoud van deze I/O-conferentie draait natuurlijk om kunstmatige intelligentie.
“Een jaar geleden op dit podium hebben we voor het eerst onze plannen voor het native multimodale grote model, Gemini, gedeeld. Het markeerde de nieuwe generatie I/O,” zei Google CEO Sundar Pichai. “Vandaag hopen we dat iedereen kan profiteren van de technologie van Gemini. Deze baanbrekende functies zullen doordringen in zoekopdrachten, afbeeldingen, productiviteits-tools, Android-systemen en vele andere aspecten.”
Momenteel zijn zowel 1.5 Pro als 1.5 Flash beschikbaar voor openbaar preview en bieden ze een contextvenster van 1 miljoen tokens in Google AI Studio en Vertex AI. Nu biedt 1.5 Pro ook een contextvenster van 2 miljoen tokens voor ontwikkelaars die de API gebruiken en Google Cloud-klanten via een wachtlijst.
Bovendien is Gemini Nano uitgebreid van pure tekstinvoer naar beeldinvoer. Later dit jaar, te beginnen met Pixel, zal Google multimodale Gemini Nano lanceren. Dit betekent dat mobiele gebruikers niet alleen tekstinvoer kunnen verwerken, maar ook meer contextuele informatie kunnen begrijpen, zoals visuele elementen, geluid en gesproken taal.
De Gemini-familie verwelkomt een nieuw lid: Gemini 1.5 Flash
De nieuwe 1.5 Flash is geoptimaliseerd voor snelheid en efficiëntie.
Nieuwe Generatie Open Source Groot Model Gemma 2
Vandaag heeft Google ook een reeks updates vrijgegeven voor het open-source grote model Gemma – Gemma 2 is hier.
Zoals geïntroduceerd, maakt Gemma 2 gebruik van een nieuwe architectuur die gericht is op het behalen van baanbrekende prestaties en efficiëntie, de nieuwe open-source modelparameters zijn 27B.
Als het gaat om lange video's, kan Veo video's van 60 seconden of zelfs langer produceren. Dit kan gedaan worden door een enkele prompt of door een reeks prompts die samen een verhaal vertellen. Dit is cruciaal voor de toepassing van video-generatiemodellen in film- en televisieproductie.
Veo is gebaseerd op Google's werk in visuele contentgeneratie, inclusief Generative Query Network (GQN), DVD-GAN, Image-to-Video, Phenaki, WALT, VideoPoet, Lumiere, en anderen.